这些"不可控"的行为,让很多人对 AI 不能完全放手去用,今天,我就来详细聊聊AI Agent Skill 这个让AI变"听话"的工具。 什么是AI Agent Skill? 实战案例解析 写作Agent Skill 以我使用的写作Agent为例,核心架构是: 两层判断机制 先判断工作区(公众号/视频/技术文档等) 再判断任务类型(新写作/修改/审校等) 9步写作流程 从理解需求到最终交付的完整流程 企业应用企业用Skill标准化业务流程,提高效率和一致性。比如"客服Skill"、"销售Skill"、"产品Skill"等。 Q:团队如何共享Skill? A:通过共享文档、代码仓库或专门的Skill管理平台。 Q:如何处理多个Skill的冲突? A:建立Skill的优先级机制,明确哪个Skill在什么情况下生效。 总结 AI Agent Skill不是什么复杂的技术概念,它就是一种让AI更听话、更实用的方法。 通过结构化的规则和流程,Skill解决了AI"不可控"的核心问题。
本文从“是什么”到“怎么用”,再到“如何写” Agent skill 的角度,把我们从无尽的提示词里解放出来。 关注“AI老马” —【获取资源】&【进群交流】 一、Agent Skill 的通俗解释 通俗的讲: Agent Skill = 给AI打包好的“专业能力模块”。 在 Anthropic 的 Agent 体系里,Skill 是让 AI 从“聊天机器人”变成“专业智能体”的核心。 可以把它理解成,给 AI 安装一个永久生效的插件,把工作流程固化成可调用的技能。 二、Agent Skill 渐进式披露 2.1,skill 的加载过程 渐进式披露是 agent skill 解决有效知识注入的精髓。 四、Skill-未来AI效率的核心组件 Skill 不是一个小功能,它是 AI Agent 时代的基础单元。Anthropic 做 Skill 的本质,是让 AI 从“随机应答”变成“专业执行”。
今天我们就拆解Antigravity的Skill能力。什么是Antigravity? 2种Skill工作区技能非常适合项目特定的工作流程,例如团队的部署流程或测试规范。全局技能适用于您所有的项目。可将这些技能用于个人实用工具或希望随处可用的通用工具。 ---创建一个skill每个技能都需要一个SKILL.md文件,并在文件顶部包含YAML前置元数据:如下是一个代码审查的skill最佳实践保持技能专注性每个技能应专注于做好一件事。 为什么Skill很重要大多数AI编程工具仍停留在“聊天模式”:你需要一遍又一遍地重复解释相同的规则。
Coding Agent、MCP、Skill 上落后于 Anthropic。 其他家的 Agent,都只能模仿,MCP 和 Skill 俨然已经形成了事实上的行业标准。 现在介绍 Skill 的文章非常多,已经可用并分享出来的 Skill 也非常多。 Cookbook:Introduction to Claude Skills Anthropic Agent Skill 文档:Agent Skills - Claude Docs Agent Skill 当 Agent 认为需要使用某个具体的 Skill,就会读取这个 Skill.md 说明(几千 token): Skill 里还可以无限嵌套下去,告诉 Agent,想要深入了解某个具体问题,还可以继续读取哪份文件 MCP 更像是 API,Agent 只关心提交什么「参数」、得到什么「结果」。 Skill 则是个代码/文件库,Agent 需要知道自己应该「如何」运行(读取)「哪个」文件。
前几天谷歌正式官宣:正式支持Agent Skill。 今天我们就拆解 Antigravity 的Skill能力。 什么是 Antigravity? 创建一个skill 每个技能都需要一个 SKILL.md 文件,并在文件顶部包含 YAML 前置元数据: 如下是一个代码审查的skill 最佳实践 保持技能专注性 每个技能应专注于做好一件事。 没有 skill 的时候,用户只能靠每次手动复制粘贴提示词,或者在系统设置里写一大段配置,体验很割裂。 有了 skill 之后,你再也不用在复制粘贴中虚度人生了,并且也不需要主动增加额外的提示,AI 就可以根据上下文自己判断。当然,如果你想确保使用某个 Skill,也可以直接提它的名字。 总结 会写 Skill 的人,相当于给自己配了一个永远不会忘事的助理。经常写 skill 的人,就会身边随时都有贴身秘书,无形中会发现自己节约很多重复的无聊工作时间。
以下是一个工具包装器的示例,它教会Agent如何编写 FastAPI 代码。 请注意,指令明确地告诉Agent,只有在开始审查或编写代码时才加载 . 它只是协调这些资源的检索,并强制Agent逐步执行它们: # skills/report-generator/SKILL.md --- name: report-generator description 指令保持不变,但Agent会从外部清单动态加载具体的审查标准,并强制生成结构化的、基于严重性的输出: # skills/code-reviewer/SKILL.md --- name: code-reviewer 关键在于严格的阶段划分和明确的把关提示,这些提示会阻止Agent在收集到所有用户答案之前生成最终计划: # skills/project-planner/SKILL.md --- name: project-planner 在用户确认上一步生成的文档字符串之前,Agent程序被明确禁止进入组装阶段: # skills/doc-pipeline/SKILL.md --- name: doc-pipeline description
Shadow:Skill把Prompt和脚本、Tool整合在一起,想要设计好用的skill,需要深刻理解原理,把适合的任务放入到Prompt、脚本和Tool。 良好架构的Skill,可以提升执行效率和准确性。 这篇论文研究得出:模型自己写的Skill没用。推荐阅读⬇️ 导读:Agent Skills 正在成为 LLM 智能体的标配,但它们真的有效吗? 随着 Claude Code、Gemini CLI 等 agent-centric 工具的爆发,Agent Skills(智能体技能)已成为增强 LLM 代理能力的热门方案。 作为首个将 Skills 作为一级评估对象的基准测试,它通过 7,308 条轨迹的大规模实证评估,揭示了 Agent Skills 效能的真相。 建议:过于详尽的文档会增加 context burden,agent 难以从中提取 actionable guidance。
目录 Skill 简介 Skill 规范详解 trpc-agent-go 中的 Skill 实现 3.1 整体架构 3.2 快速集成指南 3.3 Skill 加载机制详解(核心) 3.4 一次对话中 Skill Skill 简介 1.1 什么是 Skill? 在 LLM Agent 的发展过程中,「Tool(工具)」 是最早被广泛采用的能力扩展方式。 创建 Agent 并启用 Skill agent := llmagent.New( "my-agent", llmagent.WithSkills(repo), // 代码执行:Skill 的典型场景 代码执行是 Skill 最典型的应用场景之一,trpc-agent-go 提供了完善的执行器机制。 框架为实例,深入分析了如何在 Agent 开发中设计和集成 Skill 系统。
二、问题排查:排除常见误区遇到问题后,首先排查了最容易出现问题的两个点,均排除异常:确认Skill已成功打包:检查部署的jar包,解压后确认skill相关文件已正常包含在内,不存在打包遗漏的情况;确认SkillName 无误:核对代码中调用Skill的名称与配置文件中的名称,完全一致,排除拼写错误、大小写错误等问题。 四、临时解决方案:改用FileSystemSkillRegistry由于官方尚未修复该bug,为了不影响线上功能正常使用,我采用了临时解决方案:将Skill目录存放在服务器的文件系统中,通过指定真实路径获取 Skill,对应的查找策略改用FileSystemSkillRegistry。 returnSkillsAgentHook.builder().skillRegistry(registry).build();}五、后续需要说明的是,这只是一个临时解决方案——使用该方案后,需要手动将Skill
为什么说Skill是被"理解"而不是被"执行"的?一、简介Skill是一份写给AI看的"操作说明书",它告诉Agent在什么情况下该做什么事。 三、Skill的完整执行链路让我们通过一个具体例子来看Skill是如何工作的:用户输入"帮我看一下当前有哪些open的PR"执行过程第一步:LLM选择SkillOpenClaw将所有可用Skill的name 操作说明书教你怎么用手的教程github(教Agent怎么用ghCLI)重要区别:有Tool没Skill:Agent有手但不知道怎么干活有Skill没Tool:Agent知道该做什么但没有能力执行这就是为什么安装一个 Skill并不自动赋予Agent新的权限——你还需要确保相应的Tool已经启用。 五、一份好的Skill应该包含什么?不是命令大全很多人误以为Skill需要把每一条命令都列出来,这是不对的。LLM本身就有大量关于CLI工具的知识(来自训练数据)。
如果Agent总是犯同样的错误,或处理一类任务时总是要探索很久,用户不得不重复冗长的提示词,那么是时候把它包装成Skill了。 这里无意具体介绍其机制。 总之,Agent Skills是一个“文件夹”,里面存放着提示词、代码或其他资源。它存放在指定位置,而Agent可以按用户要求加载,或根据其「简介」选择是否主动加载。 Skills已经成为提升Agent能力的一大利器。Claude Code和Codex等工具也已经内置了帮助创建Skill的Skill。 尽管我们可以设计更复杂的专用Agent,但其实对该场景,通用Agent+Skills已经足够。 该Skill可以选择合适的方案,以求在覆盖更长时间段的前提下提升版本一致性,并根据CDS的存储方式优化下载逻辑,提升速度。 使用方法 你可以在所有支持Skills的Agent中使用。
Skill(技能) 是什么:这是一个偏产品和应用层的概念。一个 Skill 可以理解为赋予 Agent 的一种特定能力或“插件”。 对于 Agent 来说,一个 Skill 可能对应着一个或多个底层的 Function Call,也可能结合了特定的 Prompt 模板来指导 Agent 如何使用这些功能。 一个 Skill 可以封装多个 Function Call。Skill能力包应用/产品层如何将一组相关功能打包,方便 Agent 调用? Agent 通过拥有 Skill 来获得能力。MCP协议基础设施层如何让 Agent 能通用、安全地发现和连接任何工具?它是“万能接口标准”。 Skill 是技能包,将相关工具打包,让 AI 的能力模块化。 Agent 是执行者,利用大脑(LLM)规划,使用手脚(Function Call/Skill)去自主完成任务。
无需改 Agent 循环,循环 Agent 核心调度方式。 透明性 知识存在于人类可读的 SKILL.md 中,可审计、可理解、可讨论。 复用性 一个 Skill 编写一次,可以在任何兼容的 Agent 框架中加载使用。 在 agent_loop 中不需要任何结构性变化,只要像处理其他工具那样处理 Skill 即可: def agent_loop(prompt: str, history: list, max_steps skill = self.parse_skill_md(skill_md) if skill: self.skills[skill["name"] **可用技能**(当任务匹配时使用 Skill 工具调用): {SKILLS.get_descriptions()} **可用子代理**(对于需要集中注意力的子任务,使用 Task 工具调用): {get_agent_descriptions
❞ 映射到 Skill 机制: 「概览始终可见」:每次请求都告诉 Agent "你有哪些技能可用",但只给名称和一句话描述(几十个 Token) 「详情按需加载」:Agent 判断当前任务需要某个技能时 5.1 两类核心 Key Key 模式 含义 典型值 temp:skill:loaded:{agent}/{skill} 标记某 Skill 已被某 Agent 加载 "1" temp:skill:docs :{agent}/{skill} 记录 Agent 对某 Skill 选择的文档 "*" 或 JSON 数组 temp: 前缀表示这些是临时状态,不参与 Session 的持久化归档。 如果所有 Agent 的 Skill 状态都混在一起,就会出现"串台": 场景:Agent-A 加载了 code-review,Agent-B 加载了 data-analysis ❌ 不隔离:Agent-A agentName),可以高效地获取某个 Agent 的所有已加载 Skill,而不会误读其他 Agent 的状态。
背景:技能检索与部署的挑战 在利用 AI Agent(如 Claude Code, Cursor, Trae)进行开发时,开发者面临的核心挑战在于技能(Skill)的 检索效率 与 安装成本: • 发现困难 Vercel Skill 定位于 跨 Agent 的技能包管理器。它通过 find 命令建立标准化的检索机制,通过 add 命令实现自动化部署,将 Agent 的能力扩展过程标准化。 2. find-skills:赋予 Agent 搜索 skill 能力 除了 CLI 工具,官方还提供了一个名为 find-skills 的内置技能,专门用于辅助 Agent 发现新能力。 (标准 URL 或 简写)克隆仓库至临时目录读取本地路径发现并解析 SKILL.md自动探测已安装的 Agent 环境确认安装范围与方式 (Symlink/Copy)写入配置或创建软链接部署完成并打印路径 总结 Vercel Skill 通过标准化的 CLI 工具,打破了 AI Agent 技能发现与部署的壁垒: 1. 用户侧:提供了类似 npm 的丝滑体验,实现了一次安装、多 Agent 同步。
-**安装繁琐**:手动将指令内容配置到不同Agent的特定目录中,操作路径长且低效。-**配置不统一**:不同Agent的配置标准不统一,难以实现跨平台的技能同步与管理。 **VercelSkill**定位于**跨Agent的技能包管理器**。它通过`find`命令建立标准化的检索机制,通过`add`命令实现自动化部署,将Agent的能力扩展过程标准化。 搜索skill能力**除了CLI工具,官方还提供了一个名为`find-skills`的内置技能,专门用于辅助Agent发现新能力。 ->>Agent:自动探测已安装的Agent环境User->>CLI:确认安装范围与方式(Symlink/Copy)loop遍历目标AgentCLI->>Agent:写入配置或创建软链接endAgent **用户侧**:提供了类似`npm`的丝滑体验,实现了一次安装、多Agent同步。2.**开发者侧**:通过简单的`SKILL.md`规范即可发布技能,支持Git、本地路径及WebURL等多种源。3.
安装繁琐:手动将指令内容配置到不同Agent的特定目录中,操作路径长且低效。配置不统一:不同Agent的配置标准不统一,难以实现跨平台的技能同步与管理。 VercelSkill定位于跨Agent的技能包管理器。它通过find命令建立标准化的检索机制,通过add命令实现自动化部署,将Agent的能力扩展过程标准化。 find-skills:赋予Agent搜索skill能力除了CLI工具,官方还提供了一个名为find-skills的内置技能,专门用于辅助Agent发现新能力。 ->>Agent:自动探测已安装的Agent环境User->>CLI:确认安装范围与方式(Symlink/Copy)loop遍历目标AgentCLI->>Agent:写入配置或创建软链接endAgent (同时支持搜索企业内和企业外部的skill):展开代码语言:TypeScriptAI代码解释//企业内部Skill搜索接口示例(Next.js/VercelRouteHandler)//GET/api/
Shadow:这个指南可以直接作为创建skill时的prompt给curosr或者claude code使用。合理安排哪些适合放到script,哪些适合交给Agent。 Agent Skill Script 架构设计指南 本指南面向 Skill 架构师与 Agent 开发者,聚焦"何时用 Script"与"如何设计 Tool-Like 模块" 1. 核心理念:认知层与执行层的解耦 在 Agent Skill 架构中,Prompt 负责认知(理解意图、规划路径、生成创意),Script 负责执行(确定性计算、安全交互、环境操作)。 Script 架构设计原则(Tool-Like 思维) 优秀的 Skill Script 应像一个标准的 API 工具,遵循以下六大原则: 2.1 黑盒封装 隐藏实现细节:内部逻辑、密钥、第三方依赖对 降级处理 5.3 日志与审计 记录关键执行节点:输入摘要、输出摘要、耗时、错误码 日志中自动抹除用户隐私数据(PII),符合 GDPR 等合规要求 支持按 Skill ID、用户 ID、时间范围进行日志检索
Sub-Agent 模型修复:省下93%的 Token 费! 这是本次更新最“省钱”的彩蛋! 以前,Claude Code 的子代理(Sub-Agent)在做两件事时,错误地用了主模型(Sonnet): 压缩对话历史 执行网页搜索 结果?成本爆炸!
**Agent Skill 是什么? ---## 二、 核心架构:为什么 Agent Skill 是大模型的“岗位 SOP”? Agent Skill 架构对比| 维度 | 传统 System Prompt 模式 | Agent Skill 模式 || :--- | :--- | :--- || **规则载体** | 纯文本,随会话发送 Agent Skill 引入了**条件式加载(Conditional Loading)**机制。 ---## 六、 行业图谱:Agent Skill 与 MCP 的协同效应在 2026 年的技术栈中,**MCP (Model Context Protocol)** 与 **Agent Skill**